查看原文
其他

数字时代下营销革命的决胜力量 | 京东营销360营销技术首次公开

营销360团队 京东技术 2019-05-30

来这里找志同道合的小伙伴!


本文是第七届京东技术金项奖技术创新奖——京东营销360项目的技术解读。


营销行业三大痛点


当今营销行业的三大痛点

1)品牌商积累和管理消费者资产困难

2)广告投放带来的增量效果难以衡量

3)在消费者产生购买的行为和路径中,众多触点的价值分布难以客观衡量


日趋纷繁的商业场景下,为了拓展甚至维持原有的消费者群体,品牌商需要以更多形式、在更多渠道投放广告,然而收效却并不能得到保障;另一方面数字化经营产生的海量、庞杂的数据也令品牌商们亦喜亦忧,数据中隐藏诸多增益营销效果的跳板,他们却无法很好的深度挖掘并利用起来。

 

为了更好地服务好品牌商,京东针对上述痛点推出营销360项目,在固有营销理念之外创造新机。


基于分析“京X计划”和京东商城丰富的消费者大数据,项目团队将消费者行为生命周期认知(Aware)、吸引(Appeal)、行动(Act)、拥护(Advocate)四步,提出4A消费者资产模型,用来帮助品牌商洞察消费者走向品牌的动机、并管理消费者资产,实现核心资产的持续增长和品牌构建。

 

以4A消费者资产模型为支持,继续提出京东大数据驱动的4E营销学理念,开发营销策略(Evolve)、执行营销计划(Execute)、衡量营销效果(Evaluate)、改进营销举措(Enhance),贯穿全流程、一站式帮助品牌商解决痛点,助力品牌实现营销转型和品牌增长。


4E营销理念方案解析


1、开发营销策略(Evolve marketing strategies)——京东数坊、九数商业分析平台


开发营销策略第一步是进行分析和洞察。通过京东数坊消费者资产管理平台监测品牌声量,并对消费者包括4A分布与流转、各类属性、营销渠道偏好与转化效果等等信息进行过全息透视,构筑对消费者立体认知;提供消费者资产人群挖掘、触达渠道对接和营销活动资产复盘功能,帮助品牌更好地积累和管理消费者资产。


然后再依靠九数商业分析平台,对新客拉取、交叉销售、向上销售、流失分析等营销场景给予策略支持。依据不同场景,九数平台能够满足个性化数据接入需求,提供大数据算法模型助力深度分析,沉淀人群特性,无缝对接投放平台精准触达,并将数据、算法等能力向合作伙伴开放,联手打造ISV服务生态,全面满足客户需求。


实现涵盖销量、用户、流量、行业、竞品五大维度的实时及历史监测,为商家提供专业、精准的店铺运营分析数据,有效帮助商家精细化店铺运营管理,优化营销决策。


2、执行营销计划(Execute marketing campaigns)

 

在营销投放方面,京准通营销平台可以借助“京X计划”打通腾讯、头条、百度等互联网头部媒体,触达几乎100%全网用户,可以满足品牌推广、拉新、促销等多场景营销目的达成。

 

黑珑开放营销平台则充分发挥其在全渠道落地能力、流量监测和频次控制优势,助力品牌最大化释放品牌推广效能。

 

“澳洲旅游局使用九数针对其高价值人群做定向的挖掘之后,在黑珑平台上进行投放,人群触达精准率达到94%,转化率显著提升140%。”

 

此外京东DMP平台也会结合商家自有用户信息与京东用户行为大数据,为品牌商提供数据挖掘、智能化及场景化人群筛选和拓展的服务,从而实现营销效果可预估、精准化定向投放。

 

3、衡量营销效果(Evaluate marketing effectiveness)


为衡量在消费者行为生命周期不同阶段产生的资产增量、广告曝光效果,营销360还引入MRR(货币化广告价值回报率)体系,并顺势打造了业界领先的JD MTA(多触点归因)算法模型,计算不同触点对转化率的贡献,分阶段归因转化结果,让预算分配更加有据可依。


4、改进营销举措(Enhance marketing initiatives)


投放后,营销360平台通过广告主A/BTest对比广告曝光对搜索量、访问量、加购量等品牌影响力指标的影响,衡量购物前奏指标的相对提升率。并对购物路径进行分析,用于诊断活动成败原因,以此产出下次活动的目标路径人群,帮助品牌改进营销举措,持续扩展品牌广告曝光的价值边界。


重点技术介绍


1、创新的数据处理架构

 

京东数坊的创新数据处理架构,用来支撑京东全平台的品牌合作伙伴的消费者资产体系更新计算:

  • 每天计算京东数百万品牌和品牌x三级类目的消费者资产,每天新增千亿级4A消费者分层数据,在3小时内可以完成消费者资产的更新;

  • 支持组合不同的触点行为和特征进行品牌消费者4A状态计算,可以动态扩展参与计算的消费者触点为特征;

  • 数据计算任务按照品牌进行分组,可以支持计算资源和并行度动态匹配。

 

2、高效的在线分析引擎


为了支持品牌客户在线交互式地对消费者进行分层,快速地创建细分消费者群体,评估市场策略和营销创意,京东数坊实现了高效的在线分析引擎。


  • 使用ClickHouse作为在线数据分析引擎,在ClickHouse之上,设计了基于MPP 架构的并行分析引擎。将消费者分层和市场细分JOIN计算下推到数据分片节点,在数据分析服务节点聚合分析结果,可以在秒级响应用户的交互式人群洞察和创意评估需求。

  • 消费者数据按照消费者Key进行哈希分片到不同的SHARD,同一SHARD有相同的消费者群组,从而实现消费者分层和市场细分在一个节点计算完成,结果聚合到上层分析服务节点。


3、积木化的九数商业分析平台


京东九数商业分析平台是由九数商业化整体技术架构作为支撑的,通过组件化微服务、安全开放服务、算法建模引擎和大数据业务引擎支持了各类高并发灵活定制化需求,包含有数据洞察挖掘平台、算法建模平台、开放赋能平台。


1)AI驱动的九数挖掘引擎和数据平台


为了支持品牌客户对于其受众分析和大规模数据挖掘的需求,实现对全京东受众的标签化人群包挖掘,以及构建特征数据集,结合九数建模引擎,实现AI驱动的精准定向和受众分析,九数挖掘引擎实现了对站内、外,线上线下广告受众的挖掘能力开放。


九数大规模数据管理平台,是一个通过不断数据接入导出,自行分析、挖掘和提升的数据Exchange中心,支持标准和定制化的建模、消费者和行业洞察分析。其中维护着大量以人为粒度的标签和特征数据,UGC数据、外部接入数据,支持标签生成、挖掘、交换、应用,支持特征生成、挖掘、分析、交换。


基于Spark大数据集群上面,采用MPP的思路构建出九数大数据业务引擎,实现万亿行级别数据分钟级执行。


2)AI驱动的九数建模引擎和算法平台


九数算法建模引擎是以九数算法框架为核心,支持超大规模分布式计算的算法建模引擎。灵活的九数算法引擎,可以支持多场景覆盖,包括点击率预估、购买预测、客群评估等,极大的满足了不同广告主的定制化需求。平台原生支持50余种业界主流商用算法,如深层模型、浅层模型、随机森林、无监督聚类等,并且支持近数种编程语言环境支持用户自定义算法,无缝融入到用户的现有数据分析和建模流程中。九数建模引擎可以在混合异构高性能Cloud计算中以秒到分钟级别支持数十亿级参数、数百亿级样本数据的大数据训练、预估。


3)AI驱动的九数安全开放平台


九数开放平台立足于引入外部行业专家和ISV团队,用于更好地服务品牌广告主,落地更加完善的数据算法产品,提升广告效果,创造产业价值。通过高密级加密保证数据安全,推进ISV合作,支持了7个行业29家ISV共建九数生态,实现品牌主、平台端、ISV生态多方共赢的局面。

 

在京东无界零售的版图中,九数作为无界DMP底层数据支撑,开放其实现高性能大规模人群挖掘、洞察业务。现阶段已支持无界近3700家商家,生成60+标签服务多个场景,包括无界精准营销、会员通、Jpass、线下门店、Jzone、快闪店等一系列无界应用场景,近期拓展到Shop端商家后台,将开放标签和相关能力给上万家POP商家。

 

4、京东MTA模型


数据驱动归因模型,将机器学习与经济学模型结合的京东MTA模型,做到了准确识别所有对最终转化有贡献的触点,并确定每个触点对最终转化的贡献度,即基于归因模型为购物路径上的每一个接触点分配值,这个值反应了营销接触点在带来销售上的相对强度。

京东多触点归因分析流程


5、货币化广告价值回报率-MRR


运用经济学原理,根据近期同行业广告主对首焦展示广告的投入标准,测算广告变化所得到的货币化广告价值回报率,MRR越高代表广告效率越高。


6、购物路径分析介绍


购物路径分析通过还原用户购买前与购买行为关系最为紧密的关键节点数据,并梳理提炼流向特征,帮助商家解答上述问题。路径分析的优势在于通盘考量全路径覆盖,可以建立更为完善的用户行为,不仅帮助商家了解发生了什么,更能够洞悉产生某个结果的过程及原因

购物路径分析流程


难点突破


1、数据预处理瓶颈优化


在以Apache Spark为主要计算引擎的数坊数据处理Pipeline中,会使用各种Spark内置的预处理算法,如缺失值填充、分位数估计等。实践发现在处理较多列时,某些预处理算法的耗时远高于理论预估值。


以Imputer算法为例,该预处理算法会对缺失值Null值进行填充,在列数较低时,该环节并不会成为瓶颈,但在一次处理100+列的场景中,整个计算流程都卡在该环节。通过性能Profiling和源码追踪,发现Imputer会循环的处理每一列,而通过合理的设计,理论上是可以进行多列并行处理。因此重构了整个算法的实现,并在多个场景下测试了性能,在100列的情况下取得了20+倍的计算效率提升,从而解决了数据预处理流程中的瓶颈问题。


与此类似,再重构ApproxQuantile分位点估计算法和Bucketizer连续值分桶算法等,均在量级上提升了计算效率。

预处理算法的并行优化

 

在解决数坊计算瓶颈的同时,也积极将重构的算法反馈给整个Spark社区,经过Spark社区的严格测评,提交的新算法被社区采纳:Imputer(#Spark-21690)、ApproxQuantile(#Spark-14352)、Bucketizer(#Spark-22797),从而使得整个业界都受益,并在2018年的Spark+AI Summit上分享了该部分的优化工作。


2、基于Spark的超大规模线性模型训练


线性模型是一类广泛使用的机器学习算法,在数坊服务中,也常用Spark MLLib中的逻辑回归来进行购买预测等方面的业务建模。但是由于Spark的Broadcast机制,不能训练超过2G大小的模型,这限制了模型的表达能力。为了训练更复杂的模型,一种方法是采取参数服务器(PS)框架,通过Spark来进行数据预处理,通过PS来进行训练和预测。


但为了更好的将模型融入数坊Spark处理Pipeline中,寻求一种直接基于Spark的训练方法。通过Spark社区,与Hortonworks、Purdue Univ.采用一种名为Vector-free L-BFGS的优化算法,其线性模型本身以分布式RDD的形式进行存储,从而解决了Spark Broadcast的瓶颈限制,并取得了线性的模型尺寸拓展性。在实践中,可以基于现有Spark计算框架,训练超过10亿级别参数的超大模型。与此同时,研究成果《Optimizing Generalized Linear Models with Billions of Variables》也被著名AI会议CIKM 2018所采纳。

与模型大小成线性关系的训练时长

 

3、基于九数的超大规模异构多模态模型训练和预估


多模态数据利用复杂模型结构的建模和训练及在线实时预估是一项难题,其中包含异质数据训练收敛性难题,数十亿参数、数百亿级别异质样本高性能训练,离线在线模型结构异构,超大模型GPU在线实时低延迟预估等难题,九数采用了如DCN、Attention机制、多路输出等一系列复杂子结构充分提取多模态数据的特征进行训练,训练和GPU在线预估模型异构,通过CPU、GPU混合部署,大幅提升利用率和训练效率,深入优化GPU实时Inference,实现了10ms级别预估性能。

 

4、基于九数微服务体系的灵活性架构


如何适应客户和ISV生态中千变万化的需求是一个复杂的问题,九数吸取了社区先进经验,基于k8s和Service Mesh方法论,将全平台插件化、微服务化,使用48个微服务组件组成大九数平台,在保障系统容灾和兼容性的同时,通过微服务治理,实现了灵活的赋能架构,满足了灵活多变的需求,最大化了资源利用率。


总结


深度和广度并举的大数据与先进营销技术是营销革命中取胜的决定性力量,营销360正是基于京东在这两方面的巨大优势,以开放的态度,把京东打造成业界品牌建设的主阵地。未来营销360会继续深挖京东的数据优势,不断强化营销创新技术投入,完善平台能力,帮助品牌发现更多的营销增长机会,推动品牌建设持续增长,与品牌和合作伙伴实现共赢。

 

 京东技术金项奖 

京东技术金项奖是由京东集团技术委员会设立的表彰优秀研发团队及个人的奖项。评选维度围绕京东技术核心理念,创新、协作、品质和高效展开,对研发体系优秀项目、团队和个人进行选拔激励。2018年是开展金项奖的第7年,也是京东向技术转型至关重要的一年,作为集团技术奖项,将大力表彰2018年度在技术创新、业务贡献有突出成就的技术团队,以及在创新力、专业度和影响力上显露光芒的研发人员。


RECOMMEND

推荐阅读

看京东PLUS会员系统如何通过技术提升消费品质

京东科技养猪是怎么操作的?

京东技术大咖眼中的2019:大数据、AI、开放服务,技术创新在场景中产生价值

Java反序列化: 基于CommonsCollections4的Gadget分析

京东技术

---关注技术的公众号

长按识别二维码关注

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存